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Titel: Rekonf igurierbares System 



Basahrelbnmg 

Die vorliegende Erfindung betrifft das oberbegrif f lich Bean- 
spruchte. Damit befafit sich die vorliegender Erfindung mit 
der Frage, wie ein rekonf igurierbarer Prozessor auf besonders 
giinstige Art und Weise mit einem Standardprozessor vsrbunden 
werden kann. 

Onter einer rekonf igurierbar en Architektur werden vorliegend 
Bausteine (VPU) mit konf igurierbarer Funktion und/oder Ver- 
netzung verstanden, insbesondere integrierte Bausteine mit 
einer Mehrzahl von ein- oder mehrdimensional angeordneten 
arithmetisehen und/oder logischen und/oder analogen und/oder 
speichernden und/oder intern/extern vernetzenden Baugruppen, 
die direkt oder durch ein Bussystem miteinander verbunden 
sind. 

Zur Gattung dieser Bausteine zahlen insbesondere systolische 
Arrays, neuronale Netze, Mehrprozessor Systeme, Prozessoren 
mit mehreren Rechenwerken und/oder logischen Zellen und/oder 
kommunikativen/peripheren Zellen (IO) , Vernetzungs- und Netz- 
werkbausteine wie z.B. Crossbar-Schalter, ebenso wie bekannte 
Bausteine der Gattung FPGA, DPGA, Chameleon, XPUTER, etc. 
Hingewiesen wird insbesondere in diesem Zusammenhang auf die 
folgenden Schutzrechte und Anmeldungen desselben Anmelders: 
P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, 
DE 196 54 S46.2-53, DE 196 54 593.5-53, DE 197 04 044.6-53, 
DE 198 80 129.7, DE 198 61 088.2-53, DE 199 80 312.9, 
PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 
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DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, 

EP 01 102 674.7, DE 196 51 075.9-53, DE 196 54 846-2-53, 

DE 196 54 593-5-53, DE 197 04 728.9, DE 198 07 872.2, 

DE 101 39 i70.6, DE 199 26 538.0, DE 101 42 904.5, 

5 DE 101 10 530.4, DE 102 02 044.2, DE 102 06 857.7, 

DE 101 35 210.7-53, EP 02 001 331.4, 60/317,876. Diese sind 
hiermit zu Of f enbarungszwecken vollumf anglich eingegliedert- 

Die o.g. Architektur wird beispielhaft zur Verdeutlichung 
10 herangezogen und im folgenden VPU genannt. Die Architektur 
besteht aus beliebigen arithrnetischen, logischen {a\ich Spei- 
cher) und/oder Speicherzellen und/oder Vemetzungszellen 
und/oder kommunikativen/peripheren (IO) Zellen (PAEs) , die zu 
einer ein- Oder mehrdimensionalen Matrix (PAC) angeordnet 
15 sein kcSnnen, wobei die Matrix unt'erschiedliche, beliebig aus- 
ges'taltete Zellen aufweisen kann; auch die Bussysteme werden 
dabei als Zellen verstanden. Der Matrix als Ganzes oder Tei- 
len davon zugeordnet ist eine Konf igurationseinheit (CT) , die 
die Vernetzung und Funktion des PA beeinfluAt. 

20 

Aufgabe der Erfindung ist es, Neues fiir die gewerbliche Nut- 
zung bereitzustellen. 

Die LSsung der Aufgabe wird unabhangig beansprucht. Bevorzug- 
25 te Ausfiihrungsfomnen finden sich in den Unteranspruchen. 

Ein rekonfigurierbarer Prozessor (VPU) wird denvnach in eine 
technische Umgebung hineinentworf en, die einen Standardpro- 
zessor (CPU) besitzt, wie beispielsweise einen DSP, RISC, 
30 CISC-Prozessor oder (Mikro) -Kontroller aufweist. Das Design 
. erfolgt dabei derart, dass eine moglichst einfache und den- 
noch sehr leistungsf ahige Anbindung besteht. Ein weiterer 
Aspekt, der sich ergibt, ist die einfache Programmierung des 
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entstehenden Systems. Die Weiterverwendung bestehender Pro- 
gramme der CPU sowie die Codekompatibilitat und die einfache 
Integration der VPU in bestehende Programme finden durch das 
beschriebene Verfahren problemfrei Berucksichtigung. 



Stand, der Technik 

Rekonfigurierbare Bausteine (VPUs) unterschiedlicher Gattun- 
gen (wie z. B. PACT XPP-Technologie, Morphics, Morphosys, 
Chameleon) sind zu bestehenden technischen Umgebungen und 
Programmierverfahren weitgehend inkompatibel. 

Die Programme der Bausteine sind weiter inkompatibel zu be- 
reits bestehenden Programmen von CPUs. Dadurch wird ein er- 
heblicher Entwicklungsaufwand zur Programmierung erforder- 
lich, z- B. besonders fur Bausteine der Gattungen Morphics, 
Morphosys. Chameleon integriert bereits einen Standardprozes- 
sor (ARC) auf den rekonf igurierbaren Bausteinen- Dadurch ste- 
hen Tools zur Programmierung zur Verfugung. Allerdings ist 
nicht jede technische Umgebung fur den Einsatz von ARC- 
Prozessoren geeignet, insbesondere liegen bestehende Program- 
me, Codebibliotheken etc. oftmals fur beliebige unbestimmte 
andere CPUs vor. 



Besehreibung der Erfxndung 

Eine VPU (oder ohne jeweils besonders erwahnt zu werden, meh- 
rere VPUs) wird derart mit einer bevorzugten CPU gekoppelt, 
dass sie dort die Stelle und Funktion eines Coprozessors ein- 
nimmt. Die Funktion als Coprozessor ermoglicht dabei die ein- 
fache Einbindung in bestehende Programmcodes entsprechend den 
bereits existierenden Methoden zum Umgang mit Coprozessoren 

nach dem Stand der Technik. 

— 3 
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Das System kann insbesondere als (Standard) -Prozessor oder 
Baugruppe ausgestaltet sein und/oder in einem Halbleiter (Sy- 
stem on Chip SoC) integriert sein. 

5 

Urn die Coprozessor-Anbindung zwischen CPU und VPU vorzusehen, 
ist ein Daten- bzw. Informationsaustausch zwischen CPU und 
VPU erf orderlich- Insbesondere mufi der Prozessor der Copro- 
zessor-Einheit typisch Daten und Anw^isung^n ubermitteln, was 

lo mit diesen geschehen mufi. Der Datenaustausch zwischen CPU und 
VPU kann nun mittels Speicherkopplung und/oder IO-Kopplung 
erfolgen. CPU und VPU konnen dabei prinzipiell samtliche Res- 
sourcen teilen; in besonderen Ausgestaltungen ist es hingegen 
auch inSglich, dafc CPU und VPU nur eirien Teil der Ressourcen 

IS gemeinsaift verwenden / wahrend andere Ressourcen jeweils expli- 
zit und exklusive ftir die CPU oder VPU zur Verftigung stehen. 
Die Frage, welche Variante bevorzugt ist, wird typisch unter 
anderem von der Gesamtauslegung des Systems, den moglichen 
Kosten r verfiigbaren Ressourcen, der erwarteten Datenlast usw. 

20 abhangen. Es sei darauf hingewiesen, daft dort, wo auf eine 

einzelne CPU Bezug genommen wurde und wird, auch mehrere CPUs 
gemeinsam angesprochen werden konnen. 

Urn einen Datenaustausch durchzufiihren, konnen Datensatze 
25 und/oder Konf igurationen in jeweils besonders dafur vorgese- 
hen Speicherbereiche kopiert bzw. geschrieben/gelesen werden 
und/oder entsprechende Basisadressen so gesetzt werden, dali 
diese auf die jeweiligen Datenbereiche zeigen. 

30 Zur Steuerung des Coprozessors wird nun in einer bevorzugten 
Variante ein Datensatz vorgesehen, der beispielsweise die 
Grundeinstellungen einer VPU beeinhaltet, wie beispielsweise 

bestiramte Basisadressen* Des weiteren kttnnen Statusvariablen 

4 ■ 
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zur Ansteuerung unci Funktionssteuerung einer VPU durch eine 
CPU ixa Datensatz bzw. ftir die separate Ubertragung vorgesehen 
sein und mit oder getrennt von Daten ausgetauscht werden- In 
einer besonders bevorzugten Variant e konnen die Adressen fle- 
xibel verteilt und zugewiesen werden. Bevorzugt braucht somit 
lediglich eine Grundadresse im I/O- oder Speicheradressraum 
fest vereinbart 2u werden, urn mit ihrem Datensatz als Zeiger 
auf die flexibel definierten Adressen zu dienen. 

Der Datensatz kann iiber einen gemeinsamen Speicher (RAM) 
und/oder uber einen gemeinsamen peripheren Adressraum (10) 
ausgetauscht werden- Die Adressen konnen flexibel verteilt 
und zugewiesen werden. 

Zur Synchronisation der CPU und VPU konnen einseitig oder ge- 
genseitig Interruptverf ahren (z. B. Inter ruptleitungen) vor- 
gesehen sein und/oder die Synchronisation erfolgt mittels 
Pollingverf ahren- Weiterhin kttnnen Interrupts zur Synchroni- 
sation von Daten- und/oder DMA-Transfers verwendet werden. In 
einer besonders zu bevorzugenden Ausgestaltung wird eine VPU 
durch eine CPU gestartet und arbeitet danach unabhangig die 
gestartete bzw. angewiesenen Applikation ab. 

Besonders leistungsf ahig ist ein bevorzugter Aufbau, bei wel- 
chen die verwendete VPU eigene Mechanismen zum Laden und Kon- 
trollieren von Konf igurationen vorsieht. Zur Gattung dieser 
VPUs gehdren beispielsweise PACT XPP und Chameleon. Die er- 
f indungsgemaBen Schaltungen ermoglichen ein Verfahren zum Be- 
trieb derart, daB alle Konf igurationen der VPU oder ein Teil 
der VPU-Konf igurationen zusammen mit dem auszuf uhrenden Pro- 
gramm der CPU in einen Speicher geladen werden. Die CPU kann 
wahrend der Ausfiihrung des Programmes die VPU auf die Spei- 
cherstsllen verweisen (z. B. durch Angabe der Adressen oder 

5 
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Pointer), die die jeweils auszufuhrenden Konf igurationen be- 
inhalten. Die VPU kann daraufhin die Konf igurationen selb- 
standig und ohne weitere Einflufinahme durch die CPU laden - 
Wenn und soweit die VPU, d- h. das rekonf igurierbare Feld mit 
insbesondere grobgranular lauf zeitkonf igurierbaren Elementen 
eine Ladelogik zura Laden von Konf igurationen besitzt, kann es 
ausreichen, wenn der Prozessor an die CPU die Anweisung aus- 
gibt, eine bestimmte Konf iguration zu laden. Der Aufruf des 
dann als Coprozessor dienenden rekonf igurierbaren Prozessors 
kann also bevorzugt tiber einen einzigen Befehl an die Ladelo- 
gik erfolgen. Es sei darauf hingewiesen, dafi durch vorherige 
Vereinbarung zwischen VPU und CPU, also dem aufruf enden Host- 
Prozessor, genau festgelegt werden kann, welche Konf iguration 
durch welchen Aufruf auszufuhren ist . Dafi hierbei entspre- 
chende Steuermittel in der Ladelogikeinheit, sei sie dedi- 
ziert, implement iert oder durch ein oder mehrere rekonf igu- 
rierbare Zellen des rekonf igurierbaren Prozessors gebildet, 
vorgesehen sein konnen, sei erwahnt. Das Ausfuhren startet 
sofort oder ggf. durch eine zusatzliche Information (z.B. In- 
terrupt und/oder Start Befehl) durch die CPU. 

In einer besonders bevorzugten Erweiterung kann die VPU selb- 
standig innerhalb eines oder mehrerer Speicher(s), von denen 
einige jeweils gemeinsam mit oder unabhangig von der CPU 
sein konnen, Daten lesen und schreiben. 

In einer besonders bevorzugten Erweiterung kann die VPU eben- 
falls selbstandig neue Konf igurationen aus dem Speicher laden 
und sich bei Bedarf neu konf igurieren, ohne dafi es eines wei- 
teren Einflusses durch die CPU bedarf. 

Diese Ausgestaltungen ermoglichen einen weitestgehend von 
CPUs unabhangigen Betrieb von VPUs. Lediglich ein Synchroni- 
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sationsaustausch zwischen CPU und VPU, der bevorzugt bidirek- 
tional stattfinden kann, sollte zusatzlich vorgesehen warden, 
um die Datenverarbeitungen und/oder Konfigurationsausfuhrun- 
gen aufeinander abzustirmnen . 

5 

Grundsatzlich kann die Ablauf steuerung einer VPU 2war direkt 
von einem auf der CPU ausgefuhrten Programm erfolgen, das 
quasi das Hauptprogramm darstellt, das bestimmte Unterpro- 
gramme auf die VPU auslagert. Dies ist eine besonders einfach 
10 zu implementierende Variants. 

Bevorzugt werden jedoch zur Synchronisation und Ablauf steue- 
rung tiber das Betriebssystem (insbesondere den Scheduler) ge- 
steuerte Mechanismen verwendet . Ein einfacher Scheduler kann 
15 nach Ubertragung der Funktion auf die VPU, insbesondere wo 
moglich, 

1. das aktuelle Hauptprogramm auf der CPU weiterlaufen las- 
sen, sofern dieses unabhSLngig und parallel zur Datenver- 

20 arbeitung auf einer VPU ablaufen kann, 

wobei auch und/oder alternative 

2. sofern oder sobald das Hauptprogramm auf die Beendigung 
der Datenverarbeitung auf der VPU warten mufi, der Task- 
scheduler auf einen anderen Task (z. B- ein anderes 

25 Hauptprograima) umschaltet. Die VPU kann dabei unabhangig 

von dem gerade aktuellen CPU -Task im Hintergrund weiter- 
arbeiten- 

Jeder neu aktivierte Task wird typisch, sofern er die VPU 
30 verwendet, vor Verwendung priifen, ob diese fur eine Datenver- 
arbeitung zur Verfugung steht oder aktuell noch Daten in ei- 
ner Weise verarbeitet, welche die benotigten VPU-Ressourcen 

blockiert; dann mufi entweder auf die Beendigung der Datenver- 
— - 7 



•5 



80£69t? TEL G17+ 



>ina±3Id 'd TINb-'lhld 



8T : 6T S00Z-d3S-60 



Akte: PACT28/PCTE 




arbeitung gewartet Oder, falls etwa nach Priori tat bevorzugt, 
der Task gewechselt werden.. 

Ein einfaches und dennoch leistungsf &higes Verfahren Jcann 
insbesondere durch sogenannte Descriptor Tables aufgebaut 
bzw. realisierfc werden, die bespielsweise folgendermaflen rea- 
lisiert werden konnen: 



Jeder Task generiert zum Aufruf der VPU eine oder mehrere Ta- 
10 belle (n) (VPUPROC) mit einem geeigneten festgelegten Daten- 
format in dem ihirt zugewiesenen Speicherbereich. Diese Tabelle 
beeinhaltet sSititliche Steuerinf orrnation ftir eine VPU, wie 
z.B. das auszuf tthrende Programm / die auszuf iihrende Konfigu- 
ration (oder Zeiger auf die entsprechenden Speicherstellen) 
15 und/oder Speicherstelle (n) (oder j eweils ■ Zeiger darauf) 

und/oder Datenquellen (oder j eweils Zeiger darauf) der Ein- 
gangsdaten und/oder die Speicherstelle (n) (oder jeweils Zei- 
ger darauf) der Operanden oder der Ergebnisdaten. 

20 Im Speicherbereich des Betriebssystems kann sich beispiels- 
weise eine Tabelle oder verkettete Liste (LINKLIST) befinden, 
die auf samtliche VPUPROC-Tabellen in der Reihenfolge ihrer 
Erstellung und/oder Aufruf s zeigt. 

25 Die Datenverarbeitung auf der VPU lauft nunmehr bevorzugt 

derart ab, daiS ein Haupt programm einen VPUPROC erstellt und 
uber das Betriebssystem die VPU aufruft. Das Betriebssystem 
erstellt einen Eintrag in der LINKLIST. Die VPU arbeitet die 
LINKLIST ab und ftihrt die jeweils ref erenzierten VPUPROC aus, 

30 Die Beendigung einer jeweiligen Datenabarbeitung wird dann 
bevorzugt jeweils durch einen entsprechenden Eintrag in die 
LINKLIST und/oder VPUCALL Tabelle angezeigt, den die CPU z- 
B. durch regeLm£&iges Pollen abfragen kann. Alternativ konnen 
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Interrupts von der vpu z.ur CPU als Anzeige und ggf . auch zum 
Austausch des VPU-Status verwendet werden; dabei ist nicht 
nur moglich, das Erreichen des Programmendes anzuzeigen; 
vielmehr kann auch angezeigt werden, dafi und gegebenenf alls 
welcher Punkt im Unterprograrom bereits erreicht wurde. 

Die VPU arbeitet in diesem erfindungsgem^fi bevorzugten Ver- 
fahren weitgehend unabheangig von der CPU. Insbesondere konnen 
die CPU und die VPU unabhangige und unterschiedliche Tasks je 
Zeiteinheit ausftihren. Das Betriebssystem und/oder die jewei- 
ligen Tasks mtissen lediglich die Tabellen (LINKLIST bzw. VPU- 
PROC) uberwachen. 

Alternativ kann auch auf die LINKLIST verzichtet werden, in- 
dem die VPUPROCs untereinander durch Pointer verkettet wer- 
den, wie es z. B. aus Listen bekannt ist. Abgearbeitete VPU- 
PROCs werden aus der Liste entfernt, neue in die Liste einge- 
fiigt. Das Verfahren ist Programntierern bekannt und mufi daher 
nicht weitergehend ausgefuhrt werden. 

Der Aufbau einer besonders bevorzugten VPU ist in Figur 1 
•dargestellt . Vorzugsweise hierarchische Konf igurationsmanager 
(CT's) (0101) steuern und verwalten eine Anordnung von rekon- 
figurierbaren Elementen (PACs) (0102). Den CT's ist ein loka- 
ler Speicher far die Konf igurationen zugeordnet (0103) • Der 
Speicher verftigt weiterhin uber ein Interface (0104) zu einem 
globalen Speicher, der die Konf igurationsdaten 2ur Verfttgung. 
stellt. Ober ein Interface (0105) sind die Konf igurationsab- 
lSufe steuerbar. Ein Interface der rekonf igurierbaren Elemen- 
te (0102) zur Ablauf steuerung und Ereignisverwaltung (0106) 
ist vorhanden, ebenso ein Interface zum Datenaustausch 
(0107) . 

9 
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Figur 2 zeigt einen Ausschnitt aus einem beispielhaften CPU- 
System, beispielsweise einem DSP des Types C6000 von Texas 
Instruments oder ein Mikrokontroller von ARM (0201). Darge- 
stellt sind Programmspeicher (0202), Datenspeicher (0203), 
beliebige Peripherie (0204) und BMIF (0205). Uber einen Spei- 
cherbus (0206) und einen Peripheriebus (0207) ist eine VPO 
als Coprozessor integriert (0208). Bin DMA-Kontroller (EDMA) 
(0209) kann beliebige DMA-Transfers, beispielsweise zwischen 
Speicher (0203) und VPO (0208) oder Speicher (0203) und Peri- 
pherie (0204) durchfuhren. Prinzipiell kann auch die VPU 
und/oder CPU selbstandig ohne Zuhilf enahme eines DMAs auf den 
Speicher zugreifen. Der gemeinsame Speicher kann insbesondere 
auch als Dualport- oder Multiportspeicher ausgestaltet sein. 
Dem System kSnnen weitere Baugruppen zugeordnet werden, ins- - 
besondere konnen rekonfigurierbare FPGAs eingesetzt werden, 
um eine f eingranulare Verarbeitung einzelner Signale oder Da- 
tenbits zu ermoglichen und/oder flexible adaptierbare Inter- 
face (z.B. diverse serielle Schnittstellen (V24, USB, etc.), 
diverse parallele Schnittstellen, Festplattenschnittstellen, 
Ethernet, Telekommunikationsschnittstellen (a/b, TO, ISDN, 
DSL, etc) ) aufbauen zu konnen. 



Figur 3 zeigt eine abstraktere Systemdefinition. Einer CPU 
(0301) ist Speicher (0302) zugeordnet, auf den diese schrei- 
benden und/oder lesenden Zugriff besitzt. Eine VPU (0303) ist 
mit dem Speicher gekoppelt. Die VPU ist in einen CT-Teil 
(0309) und die rekonf igurierbaren Elemente zur Datenverarbei- 
tung (0310) untergliedert . 

Zur Steigerung der Speicher zugr if f e kann der Speicher mehrere 
unabhangige, unter Umstanden gleichzeitig. verwendbare Zu- 
griffsbusse aufweisen (multiport) . In einer besonders bevor- 
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zugten Ausgestaltung ist der Speicher in mehrere unabhangige 
Segment e (Speicherbanks) segment iert, wobei auf jede Bank un- 
abhSngig zugriffen werden kann- SSmtliche Segmente liegen 
vor2ugsweise innerhalb eines einheitlichen Adressraums. 

5 

Vorzugsweise steht ein Segment hauptsachlich fur die CPU 2ur 
Verfugung (0304), ein weiteres Segment steht hauptsachlich 
fiir die Datenverarbeitung der VPU zur Verftigung (030S) , ein 
weiteres Segment steht hauptsachlich fur die Konf igurations- 
10 daten der VPU zur Verfiigung (0306) - 

Typischerweise und bevorzugt weist eine vollausgestaltete . VPU 
eigene Adressgeneratoren und/oder DMAs auf, um Datentransf ers 
durchzufiihren. Alternativ und/oder zusatzlich ist es mftglich, 
15 dass ein DMA (0307) innerhalb des Systems (Fig. 3) fiir Daten- 
transf ers mit der VPU vorgesehen ist- 

Das System enthalt IO-Mittel (0308), auf die CPU und VPU Zu- 
griff haben konnen. 

Sowohl CPU als auch VPU konnen jeweils dedizierte Speicherbe- 
20 reiche und IO-Bereiche aufweisen, auf die der jeweils andere 
keinen Zugriff hat. 

Ein Datensatz (0311) der, wie graphisch dargestellt, im Spei- 
cherbereich und/oder im 10-Bereich und/oder partiell in einem 
von beiden liegen kann, wird zur Koittmunikation zwischen CPU 
25 und VPU verwendet, z. B. zum Austausch von Basisparametern 

und Steuerinf ormation. Der Datensatz kann beispielsweise fol- 
gende Information beeinhalten und stellt somit einen Grund- 
einstellungsdatensatz dar: 

1. Basisadresse (n) des CT-Speicherbereiches in 0306 zur Lo- 
30 kalisierung der Konf igurationen, 

2- Basisadresse (n) von Datentransf ers mit 0305, 
3. I/O-Adressen von Datentransf ers mit 0308, 

11 



•S S2£SSP TE£ GP+ 



mUlSld 'd "PlNb-'ibd 



BT:6T E00Z-d3S-60 



Akte: PACT28/PCTE 




4. Synchronisationsinformation, z. B. Zuriicksetzen, Anh'al- 

ten, Starten der VPU, 
5- Statusinformation der VPU, z. B. Fehler Oder Zustand der 

Datenverarbeitung. 

5 6. 

Die Synchronisation der CPU und VPU erfolgt durch Polling von 
Statusdaten und/oder -inf ormationen und/oder bevorzugt durch 
Interruptsteuerung (0312) . 

0 Der Grundeinstellungsdatensatz kann eine LINKLIST und/oder 

VPOCALLs enthalten, oder alternativ auf die LINKLIST und/oder 
VPUCALLs oder den jeweils ersten Eintrag derer durch Pointer 
zeigen. 



15 Figur 4 zeigt eine mogliche Ausgestaltung der Interf acestruk- 
tur einer VPU zur Einbindung in ein System &hnlich Figur 3. 
Dazu werden der VPU ein Speicher/DMA- und/oder IO-Interface 
zum Datentransfer zugeordnet (0401); ein weiteres System- 
Interface (0402) tibernimmt die Ablauf steuerung wie z. B. das 

20 Verwalten von Interrupts, das Starten/Stoppen der Verarbei- 
tung, Austausch von FehlerzustSnden, etc. 

Das Speicher/DMA^ und/oder IO^Interface wird an einen Spei- 
cherbus und/oder IO-Bus angeschlossen. 

Das System-Interface wird vorzugsweise an einen IO-Bus ange- 
2S schlossen, kann jedoch alternativ oder zusStzlich entspre- 
chend 0311 auch an einen Speicher angeschlossen sein. 
Die Interface (0401, 0402) konnen zur Anpassung von unter- 
schiedlichen Arbeitsf requenzen von CPU und/oder VPU und/oder 
System ausgestaltet sein und eine Taktanpassungsschaltung 
0 aufweisen, beispielsweise kann das System bzw. die CPU mit 
4 00MHz und die VPU mit 200MHz arbeiten. 

Die Interface konnen mit einer Protokollanpassungsschaltung 

,™!? e tJbersetzun g d ^r Busprotokolle durchfiihren, beispielswei- 

12 
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se kann das VP^Tnterne Protokoll auf ein exfSrnes AMBA- 
Busprotokoll umgesetzt werden und umgekehrt. 

Das Speicher/DMA- und/oder IO-Interface unterstutzt den Spei- 
cherzugriff der CT auf einen externen Speicher, der vorzugs- 
weise direkt (memory mapped) erfolgt. Der Datentransf er der 
CT(s) und/oder PAC(s) kann gepuffert z. B. fiber FIFO-Stufen 
erfolgen. Externer Speicher (z.B. 0308, 0203) kann direkt an- 
gesprochen und adressiert werden, weiterhin konnen DMA inter- 
ne und/oder externe DMA-Transfers durchgefuhrt werden. 
Ober das System-Interface erfolgt die Steuerung der Datenver- 
arbeitung, wie beispielsweise die Initialisierung und/oder 
der Start von Konf igurationen, Des weiteren werden Status 
und/oder Fehlerzustande ausgetauscht . Interrupts fur die 
Steuerung und Synchronisation zwischen den CT's und einer CPU 
k5nnen untersttitzt werden. 

Das System-Interface kann VPU-interne Protokolle derart kon- 
vertieren, daA diese auf externe (Standard) -Protokolle umge- 
setzt werden (z. B. AMBA) . 

Es wird darauf hingewiesen, daft es auch moglich ist, Busin- 
terfaces, RAM-Zellen, I/O-Zellen und dergleichen als Teile 
(PAEs) einer VPU vorzusehen- Dies gilt auch dann, wenn diese 
Einheiten fur die Prozessor-Coprozessor-Kopplung verwendet 
werden sollen. 

Ein bevorzugtes Verfahren zur Codegenerierung filr das be- 

schriebene System ist in der Patentanmeldung PACT20 beschrie- 

ben, die 2U Of f enbarungszwecken vollumf Mnglich eingegliedert 

wird. Das Verfahren beschreibt einen Compiler, der Pro- 

grammcode in Code far eine CPU und Code ftir eine VPU zer- 

teilt. Nach unterschiedlichen Verfahren wird die Zerlegung 

auf die unterschiedlichen Prozessoren durchgef tihrt - In einer 

besonders bevorzugten Ausfiihren werden die jeweiligen zerleg- 

13 
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. ten Codes urn die Interf ace-Routinen zur Kommunikation zwi- 
schen CPU und VPU erweitert. Die Erweiterung kann automatisch 
durcb den Compiler erfolgen. 

5 Ein erf indungsgem&Jier Vorteil ist, dass Verwaltungs- und/ ode r 
Interfaceaufwafid sowie Programmierung des erfindungsgemafi^n 
Syst ernes unaufwendig und einfach sind. 

Die nachfol-genden Tabellen zeigen beispielhaf te Kommunikatio- 
10 nen zwischen einer CPU und einer VPU. Den Spalten sind die 
jeweilig aktiven Funktionseinheiten zugeordnet: CPU, System- 
DMA und DMA-Interface (EDMA) bzw. Speicher-Interface (Spei- 
cher-I/F), System-Interface (System-I/F, 0402), CT's, sowie 
die PAC. In den Zeilen sind die einzelnen Zyklen in ihrer 
is Ausftihrungsreihenfolge eingetragen. Kl referenziert eine aus- 
2Ufuhrende Konf iguration 1- 

Die erste Tabelle zeigt beispielsweise einen Ablauf bei Ver- 
wendung der System-DMA (EDMA) zum Datentransf er - Jede 2eile 
20 zeigt einen sequentiell ablaufenden Steuervorgang; die Spal- 
ten zeigen die jeweilige Aktivitat in der entsprechenden Bau- 
gruppe : 



CPU 


EDMA 


System-I/F 


CT 1 s 


PAC 


Initiiere 
Kl 












Lade Kl 








Starte Kl 






Konf iguriere 
Kl 




Initiiere 
laden der 
Daten per 




Starte Kl 




Warten auf 
Daten 
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EDMA 










Initiiere 
lesen der • 
Da ten per 
EDMA 


Datentransf er 
lesen der Da- 
ten 






Datenver- 
arbeitung 




Datentransfer 
schreiben der 
Daten 


Signalisiere 
Ende der 
Operation 







Es ist zu erwahnen, dass die Synchronisation zwischen der ED- 
MA and der VPU automat isch iaber das Interface 0401 erfolgt, 
d.h. DMA-Tranfers finden nur statt, wenn die VPU dafur bereit 
ist. 



In einer zweiten Tabelle ist beispielsweise ein bevorzugter 
optimierter Ablauf dargestellt. Die VPU besitzt selbst direk- 
ten Zugriff auf den Konf igurationsspsicher (0306) . Des weite- 
ren werden die Datentransf ers durch DMA-Schaltung innerhalb 
der VPU ausgeftthrt, die beispielsweise fest implementiert 
sein konnen (PACT03) und/oder durch die Konf iguration von 
konfigurierbaren Teilen der PAC entstehen. 



CPU 


EDMA 


System-I/F 


CT's 


PAC 


Initiiere 
Kl 










Starte Kl 


Lesen der 
Konf iguration 




Konfiguriere 
Kl 






Datentransf er 
lesen der Da- 
ten 


Starte Kl 




Lese Daten 










Datenver- j 
arbeitung 
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Datentransfer 


Signalisiere 




Schreibe 




schreiben der 


Ende der 




Daten 




Daten 


Operation 







Der Arbeits- und Synchronisationsauf wand fur die CPU ist mi- 
nimal/ wodurch eine maximale Performance erreicht wird- 



5 Weiterhin kann das Verfahren vorsehen, mehrere Konf iguratio- 
nen auf unterschiedlichen Bereichen der VPU, also auf unter- 
schiedlichen PAEs zugleich, auszufuhren oder auf denselben 
Ressourcen zeitgemultiplext auszufuhren - 



10 Insbesondere kann eine Art. "Double-Buffering" zur besonders 
einfachen und zugleich schnellen Rekonf iguration angewendet ■ 
werden, in welchem eine Mehrzahl von VPUs vorgesehen sind, 
wobei ein Teil zu einem Zeitpunkt der VPUs rekonf iguriert 
werden kann / wahrend ein anderer Teil rechnet und moglicher- 

15 weise ein Weiterer inaktiv sein kann. Die Daten-, Trigger-, 

Status verbindungen etc. werden zwischen der Mehrzahl von VPUs 
geeignet ausgetauscht und ggf . durch adressierte Busse 
und/oder Multiplexer/Demultiplexer entsprechend der aktuell 
aktiven und/oder zu rekonf igurierenden VPUs verschaltet. 

20 

Samtliche erwahnten PACT Patentanmeldungen und deren Famili- 
enmitglieder sind zu Of f enbarungszwecken vollumf anglich ein- 
gegliedert . 

25 Beliebige weitere Ausgestaltungen und Kombinationen der er- 

lauterten Erfindungen sind moglich und einem Fachmann of fen- 

sichtlich. Es sei in diesem Zusammenhang insbesondere er- 

wahnt, daG anstelle einer Kopplung einer VPU an einen CPU un- 

ter Verwendung der VPU als Koprozessor gleichfalls eine sol- 

30 che Kopplung unter Verwendung der CPU als Koprozessor moglich 
■* * 16 



52 "S BB£SSP T2i 6t?+ 



GT : 61 2002-d3S-G2 



Akt e : PACT2 8 / PCTB 



10 



ist. Ein solcher Fall ist insbesondere dann bevorzugt, urn bei 
der Compilierung als Programmteile mit nur geringer Paralle- 
litat und/oder geringen Vektoranteilen erkannte Bef ehlsstruk- 
turen sequenziell abarbeiten zu lassen. Es ist dann insbeson- 
dere moglich, dafl die VPU iiber Linklisten oder Tabellen die 
CPU aufruft. Die ' Linklisten oder Tabellen konnen dabei etwa 
Information enthalten, die angibt, wo Daten zu holen sind, 
unter welcher Adresse die CPU auf von ihr abzuarbeitende Pro- 
gramminfontiation zugreifen kann usw. Die Abfrage, ob die CPU 
dann mit der Abarbeitung der von ihr auszuf iihrenden Programm- 
Teile fertig ist, kann wiederum iiber ein Polling oder dergl. 
geschehen. Auch hier ist es moglich, das Betriebs system ein- 
zusetzen, um der CPU Aufgaben zuzuweisen und/oder die von ihr 
auszuf tihrenden Tasks zu uberwachen. Prinzipiell lassen sich 
is demnach alle beschriebenen Verfahren sowohl fur die Kopplung 
einer CPU an eine VPU als Coprozessor als auch umgekehrt ver- 
wenden. Wichtig kann dabei allei.ne werden, far welche Art der 
Kopplung das Betriebssystem ausgelegt ist- Es sei darauf hin- 
gewiesen, dafi es insbesondere moglich ist, ein Betriebssystem 
20 vorzusehen, das eine wechselseitige Kopplung ermoglicht, also 
insbesondere wahlweise die CPU an die VPU bzw. Telle da von 
koppelt und umgekehrt. Letzteres ist etwa besonders vorteil- 
haft, wenn ganze Programmblocke mit tlberwiegend sequenziellen 
Anteilen von der VPU als Host an die CPU als Koprozessor ab- 
25 gegeben werden sollen und diese Programmblocke noch partiell 
stark vektoriellen oder parallelen Code aufweist, der von der 
• CPU quasi Rtickiibertragen werden kann, insbesondere im Anspre- 
chen auf eine ermittelte derzeitige oder prognostizierte VPU- 
Last . 



30 
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Patentanspruche 

5 

1. Datenverarbeitungssystem, dadurch gekennzeichnet, dafi zu- 
mindest ein rekonf igurierbarer Prozessor rait einem Stan- 
dardprozessor (CPU) gekoppelt ist. 

10 2. Datenverarbeitungssystem nach Anspruch I,, dadurch gekenn- 
zeichnet, dafc der rekonf igurierbare Prozessor als Copro- 
zessor angeordnet 1st. 



15 



20 



25 



3. Datenverarbeitungssystem nach einem der vorhergehenden 
Ansprtiche, dadurch gekennzeichnet , dafc ein Speicher- 
und/oder I/O-Kopplungsmittel zur Ankopplung von Standard- 
prozessor und rekonf igurierbarem . Prozessor aneinander 
vorgesehen ist. 

4- Datenverarbeitungssystem nach einem der vorhergehenden 

Anspriiche, dadurch gekennzeichnet , dafi die Kopplungsmit- 
tel zur Ankopplung durch Ubertragung von Daten und/oder 
Statusinformationen und/oder Konf igurationen ausgebildet 
sind. 



5. Datenverarbeitungssystem nach einem der vorhergehenden 
Anspruche, dadurch gekennzeichnet, dali • die CPU und der 
rekonf igurierbare Prozessor und/oder deren Peripherie so 
ausgebildet sind, dali sie auf zumindest einen Teil der 
30 ihnen zur Verfugung stehenden Ressc-urcen und insbesondere 

auf einen Teil des Speicherbereiches gemeinsam zugreifen 
konnen . 



18 
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DatenverarBSItungssystem nach einem der^orhergehenden 
Ansprttche, dadurch gekennzeichnet, daB zur Synchronisati- 
on zwischen CPU und rekonf igurierbarem Prozessor 2\imin- 
dest eine ein- und/oder mehrseitige Interrupt-Leitung 
vorgesehen ist. 

Datenverarbeitungssystem nach einem der vorhergehenden 
Ansprttche, dadurch gekennzeichnet, dafi der rekonf igurier- 
bare Prozessor eigene Konf igurationslade- und/oder Kon- 
trollmittel aufweist, insbesondere zur zumindest partiel- 
len Neu- und/oder Umkonf iguration ohne CPU-Eingang wah- 
rend der Laufzeit* 

Ein auf einem Chip integriertes Datenverarbeitungssystem 
nach einem der vorhergehenden Anspriiche- 

Verfahren zur Datenverarbeitung mit einem rekonf igurier- 
baren und .einem Standard-Prozessor, worin der Standard- 
prozessor auf dem rekonf igurierbaren Prozessor auszufiih- 
rende Dnterprogramme bzw. Onterprogrammteile aufruft und 
diese auf dem rekonf igurierbaren Prozessor ausgefuhrt 
werden oder umgekehrt. 

Datenverarbeitungsverfahren nach dem vorhergehenden An- 
spruch r dadurch gekennzeichnet , daB beim Aufruf des re- 
konf igurierbaren Prozessors Steuerinf ormation generiert 
wird. 

Datenverarbeitungsverfahren nach dem vorhergehenden An- 

spruch, dadurch gekennzeichnet , dafi die Steuerinf ormation 

als Tabelle generiert wird, die insbesondere die auszu- 

fiihrende Konf iguration und/oder Zeiger auf entsprechende 

Speicherstellen und/oder Datenquellen und/oder Operanden- 

19 
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Speichersi^^.en und/oder Ergebnisdaten-^^icherstellen 
bzw. Zeiger darauf umfafit* 

12. Verfahren zum Betrieb eines Datenverarbeitungssystems 

5 nach einem der vorhergehenden Verf ahrensansprtiche, worin 

bei Aufruf des Coprozessors eine Linkliste erstellt und 
vom rekonfigurierbaren Prozessor abgearbeitet wird. 

13. Verfahren nach einem der vorhergehenden Verf ahrensansprii- 
10 che, dadurch gekennzeichnet, dafi die zwischen rekonfigu- 

rierbarem -und Standardprozessor ausgetauschten Infonna- 
tionen eine Basisadresse eines Ladelogikspeicherbereiches 
zur Lokalisierung von Konf igurationen, eine Basisadresse 
von Datentransf ers, I/O-Adressen von Datentransf ers/ Syn- 
15 chronisationsinf ormation, insbesondere betreffend Zuriick- 

setzen, Anhalten oder Starten der VPU, und/oder Statusin- 
format ionen der VPU, insbesondere Fehler und/oder Zustan- 
de der Datenverarbeitung betrifft- 

20 14. Verfahren zur Datenverarbeitung nach einem der vorherge- 
henden Verf ahrensan^priiche, dadurch gekennzeichnet, dafi 
eine Synchronisation von CPU und VPU durch Polling von 
Statusdaten und/oder -inf ormationen und/oder durch eine 
Interruptsteuerung erfolgt. 

25 
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Titel: Rekonf igurierbarfes System 

Zusamiaenf as sung 

5 

Ein rekonf igurierbarer Prozessor (VPU) wird in eine techni- 
sche Umgebung eindesignet , die einen Standardprozessor (CPU) 
besitzt, wie beispielsweise einen* DSP, RISC, CISC-Prozessor 
Oder (Mikro) -Kontroller aufweist. Das Design soil derart er- 

10 folgen, dass eine moglichst einfache und leistungsf ahige An- 
bindung besteht. Ein weiterer Aspekt ist die einfache Pro- 
grammierbarkeit des entstehenden Systems. Die Weiterverwen- 
dung bestehender Programme der CPU sowie die Codekompatibili- 
tat und die einfache Integration der VPU in die bestehenden 

is Programme finden Berucksichtigung. 
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